花費 27 ms
機器學習筆記—增強學習

本文介紹增強學習和自適應控制。 在監督學習中,算法是要輸出盡量模仿訓練集中的標簽 y,標簽給每個輸入 x 一個清楚的正確答案。與此不同,對於許多序列決策和控制問題,就很難對算法給出這種明確的監督。例 ...

Wed Apr 27 18:46:00 CST 2016 0 5159

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM